Le travail qui suit s’appuie sur cinq fichiers issus du projet SnpNet :
- strain.csv : nom des lignées utilisées et informe si elles sont contrôles ou non.
- individual.csv : informations de chaque drosophile : name, id, date, age, sex, user, strain_number.
- phenotype_data.csv : données phénotypiques obtenues à partir d’un logiciel et de films des coeurs disséqués.
- phenotype_data.csv_control_nooutliers.csv : même fichier que phenotype_data.csv, à ce près que les individus considérés comme outliers ont été retirés.
- phenotype_data.csv_date_correction.csv : correction journalière déduite des contrôles à appliquer aux données phénotypiques (à voir si on l’utilisera).
Le contenu de presque tous les fichiers cités au-dessus a été compilé pour donner un dataframe au format long le plus complet possible quant aux drosophiles étudiées et aux valeurs recueillies. Le fichier phenotype_data.csv n’est pas concerné car on choisit de travailler avec les données sans outliers. Le fichier est stocké sous l’intitulé 01_DATA_raw. Nous ne nous intéressons pas aux données des drosophiles w1118 qui sont les contrôles, on recueille donc uniquement les lignées DGRP dans le fichier 02_DATA_dgrp
Le barplot ci-dessous représente le nombre d’individus par lignée et par âge.
Quelques lignées ont été répliquées. Excepté pour les lignées wild type, seul un des réplicat sera conservé : celui avec le plus grand nombre d’individus, et dans un cas d’égalité, celui dont la date d’expérimentation sera la plus proche de celle du deuxième âge étudié. Un dataframe “DATA_QC” est créé et les lignées qui ne seront finalement pas analysées sont indiquées par “dup” dans la colonne “QC”.
Le graphique ci-dessous montre les différents réplicats dans le lot d’individus étudiés, on peut voir qu’il s’agit exclusivement de duplicats. Le second barplot montre la nouvelle allure des individus par lignées lorsque les duplicats sont retirés.
## Chosen by date : dgrp310 dgrp317 dgrp405 dgrp406 dgrp850
Pour chacun des phénotypes, seulement les lignées contenant plus de 8 drosophiles à chaque âge sont analysées. Si un phénotype n’a plus un nombre suffisant de lignées, il n’est pas analysé.
Le problème est que certaines lignées n’ont pas assez de drosophiles peu importe le phénotype (lignées en dessous de la ligne pointillée sur le graphique précédent). Ces lignées sont indiquées par “under” dans la colonne “QC2” de “DATA_QC”. Ce dataframe est visible dans le fichier exporté 03_DATA_FilterStrains.
## Strains with less than 8 drosophiles : dgrp818 dgrp859 dgrp409 dgrp42 dgrp911
Six lignées ont été retirées. Les données sont réorganisées pour obtenir des graphiques sans “trous”. En effet, ce même barplot sera présent au début de l’analyse de chaque phénotype, ce qui facilitera l’observation des lignées retirées pour chacun des phénotypes.
Voici la distribution des individus par lignées et par âge pour les 163 lignées restantes après retrait des individus “dup” et “under”. Ces données sont regroupées dans un nouveau dataframe qui sera la base de nos analyse : “DATA_Analysis” (visibles dans le fichier 04_DATA_Analysis).
La distribution des individus par phénotype et par âge aide à visualiser quelles données ont été les plus dures à obtenir. Certaines jugées incorrectes (dues à une erreur technique par exemple) au premier regard ont été supprimées du fichier phenotype_data.csv dans une étude préalable.
On voit que le phénotype Pcent_DI_sup3 n’est plus représenté par aucun individu. Etant donné le faible nombre d’invididus pour certaines lignées, telle que Pcent_Long_DI, il serait statistiquement faux de les analyser.
Les données de “DATA_Analysis” sont fractionnées selon chacun des phénotypes. A nouveau, nous ne souhaitons garder que les lignées ayant un minimum de 8 drosophiles à chaque âge. Un nouveau dataframe est créé pour chaque phénotype, nommé “DATA_Nomphénotype”, contenant les données après filtre des lignées. Les phénotypes avec moins de 80% des lignées restantes ne sont pas analysés.
Dans le cadre de l’analyse des données, nous utiliserons la mediane qui a l’avantage de ne pas être influencee par des valeurs extremes comme nous en rencontreront. Pour l’étude de la variance au sein d’une lignée, la mad (mediane absolute deviation) est utilisée. La mad est à la médiane ce que le sd est à la moyenne, elle donne donc une information sur la dispersion des données. De manière plus concrête, voici comment elle est calculée :
1. La médiane d’un ensemble de données est déterminée : \(m\).
2. La différence de la valeur de chaque individu avec la médiane est ensuite calculée : \(xi-m\).
3. On prend la valeur absolue des différences et on détermine leur médiane : \(MED([ |xi-m| ]_{i=1:n})\).
Cette dernière valeur est la mad. En toute logique, elle a le même avantage que la médiane de ne pas tenir compte des valeurs extrêmes.
La simple différence de la médiane et de la mad aux âges 4 et 1 ne prennent pas en compte l’importance de l’évolution, c’est à dire le pourcentage de variation du phénotype. Deux indicateurs ont donc été mis en place : - l’indicateur de moyenne \(I_m\) : la différence médiane4 - médiane1 est divisée par la médiane1 \(I_m = (med_4-med_1)/med_1\).
- l’indicateur de variation \(I_v\) : le coefficient de variation est la division de l’écart-type par la moyenne. On a un équivalent basé sur les rangs en faisant la division de la mad par la médiane. Ici, on a donc \(CV_r = mad / med\). Comme pour la mediane, on va prendre en compte la différence des coefficients de variation à l’âge4 et à l’âge1, puis on divise par le coefficient de variation à l’âge1, c’est à dire \(I_v = (CV_r4-CV_r1)/CV_r1\) .
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1526700, p-value = 3.125e-05 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 4942, p-value = 0.005531 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.9666, p-value = 0.0005974
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98763, p-value = 0.1699
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 375710, p-value = 4.251e-10 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4697535
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 7608, p-value = 0.09251 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.84583, p-value = 8.985e-12
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.94899, p-value = 1.877e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 652930, p-value = 0.3203 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.07851265
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 1012800, p-value = 1.677e-08 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.4293392
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1212800, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 2009, p-value = 1.601e-14 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.9034, p-value = 7.681e-09
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98584, p-value = 0.1129
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 413070, p-value = 4.581e-08 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4170354
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 3187, p-value = 1.135e-08 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.9087, p-value = 1.61e-08
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97187, p-value = 0.002922
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 519040, p-value = 0.0006046 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2674731
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 743910, p-value = 0.528 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.04989126
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1194100, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 1837, p-value = 1.628e-15 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.91882, p-value = 7.134e-08
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.97465, p-value = 0.005427
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 430770, p-value = 3.127e-07 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3920523
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 2889, p-value = 5.382e-10 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.91049, p-value = 2.077e-08
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97057, p-value = 0.002218
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 563420, p-value = 0.009029 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2048391
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 688520, p-value = 0.7206 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.02828691
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1402900, p-value = 1.094e-15 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 3484, p-value = 1.863e-07 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.80475, p-value = 1.945e-13
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.92764, p-value = 7.342e-07
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 456740, p-value = 4.036e-06 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3553978
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 4016, p-value = 1.54e-05 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.92877, p-value = 3.452e-07
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.98631, p-value = 0.134
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 502630, p-value = 0.0001867 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2906271
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 663230, p-value = 0.4182 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.06397897
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1623600, p-value = 0.2907 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 6433, p-value = 0.7788 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.68518, p-value < 2.2e-16
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.9349, p-value = 1.565e-06
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 494660, p-value = 0.0001018 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3018809
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 6747, p-value = 0.8084 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.88101, p-value = 4.339e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97184, p-value = 0.003279
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 528980, p-value = 0.001175 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2534447
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 531950, p-value = 0.001423 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2492559
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 84.5679 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1257600, p-value = 2.086e-12 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 6974, p-value = 1.381e-06 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.98195, p-value = 0.06692
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98391, p-value = 0.1129
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 126050, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.7058553
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 5874, p-value = 0.01373 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.91306, p-value = 2.251e-07
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95184, p-value = 0.0001479
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 377040, p-value = 0.1618 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1201579
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 440990, p-value = 0.7358 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.02905707
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 84.5679 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1136200, p-value = 0.0614 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5432, p-value = 0.1298 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.95653, p-value = 0.0002481
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98425, p-value = 0.1225
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 213760, p-value = 6.598e-10 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.5011761
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 4120, p-value = 0.1929 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.72527, p-value = 1.065e-14
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.94688, p-value = 5.765e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 411070, p-value = 0.636 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.04074804
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 566870, p-value = 0.0001296 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.3228014
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1108800, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 1587, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.96519, p-value = 0.0004273
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.99357, p-value = 0.72
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 432010, p-value = 3.559e-07 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3902995
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 3184, p-value = 1.102e-08 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.8714, p-value = 1.405e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97168, p-value = 0.002903
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 560410, p-value = 0.007674 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2090928
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 618310, p-value = 0.1062 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1273722
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1075400, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 1267, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.94723, p-value = 9.287e-06
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.99075, p-value = 0.4136
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 428130, p-value = 2.372e-07 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3957697
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 2436, p-value = 3.282e-12 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.8761, p-value = 2.422e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.96256, p-value = 0.0003651
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 546630, p-value = 0.003513 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.228535
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 662290, p-value = 0.4086 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.0653056
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1376800, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 3219, p-value = 1.552e-08 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.84834, p-value = 1.161e-11
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.92921, p-value = 5.676e-07
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 445300, p-value = 1.357e-06 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3715403
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 4003, p-value = 1.395e-05 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.94743, p-value = 9.664e-06
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97008, p-value = 0.001588
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 534750, p-value = 0.0017 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.245307
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 650390, p-value = 0.2987 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.08209738
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1570700, p-value = 0.007043 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5586, p-value = 0.08963 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.81969, p-value = 7.303e-13
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.93, p-value = 8.004e-07
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 504560, p-value = 0.0002155 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2879061
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 6174, p-value = 0.4752 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.80864, p-value = 2.727e-13
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.98739, p-value = 0.1751
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 535090, p-value = 0.001737 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2448244
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 673810, p-value = 0.535 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.04904447
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 2238700, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 11741, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.86361, p-value = 5.871e-11
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.97987, p-value = 0.02225
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 451230, p-value = 2.405e-06 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3631713
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 8612, p-value = 0.0007757 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.90978, p-value = 1.878e-08
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.96091, p-value = 0.0001966
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 565140, p-value = 0.009897 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.202406
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 716440, p-value = 0.8882 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.01111972
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 2242800, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 11767, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.87082, p-value = 1.315e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98377, p-value = 0.06756
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 439750, p-value = 7.836e-07 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3793731
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 8632, p-value = 0.0006869 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.92709, p-value = 2.621e-07
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95294, p-value = 3.644e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 559470, p-value = 0.00729 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2104194
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 757470, p-value = 0.3823 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.06903146
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1804100, p-value = 3.054e-06 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 8662, p-value = 0.0005712 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.827, p-value = 1.435e-12
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.94775, p-value = 1.89e-05
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 484360, p-value = 4.483e-05 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3164117
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 8042, p-value = 0.01604 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.92501, p-value = 1.874e-07
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.953, p-value = 3.691e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 535530, p-value = 0.001787 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2441977
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 745330, p-value = 0.5116 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.0518925
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1522400, p-value = 2.45e-05 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5073, p-value = 0.01061 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.88005, p-value = 3.867e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.95433, p-value = 6.432e-05
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 460110, p-value = 5.507e-06 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3506388
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 5039, p-value = 0.008998 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.8787, p-value = 3.289e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.94647, p-value = 1.396e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 596280, p-value = 0.0441 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1584578
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 892970, p-value = 0.0008544 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.2602641
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1739100, p-value = 0.01156 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 7627, p-value = 0.08651 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.90855, p-value = 1.575e-08
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.97121, p-value = 0.002482
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 393330, p-value = 4.418e-09 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4448918
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 6388, p-value = 0.7217 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.7674, p-value = 9.466e-15
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.9353, p-value = 1.676e-06
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 551450, p-value = 0.00465 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2217353
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 640550, p-value = 0.2241 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.0959875
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1806400, p-value = 3.381e-06 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 8307, p-value = 0.004355 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.92319, p-value = 1.406e-07
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.95472, p-value = 5.246e-05
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 413990, p-value = 5.082e-08 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4157341
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 7034, p-value = 0.47 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.85958, p-value = 3.784e-11
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.96964, p-value = 0.001694
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 568470, p-value = 0.01178 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1977063
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 707080, p-value = 0.9789 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.002090152
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1630400, p-value = 0.4157 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 6039, p-value = 0.3473 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.64575, p-value < 2.2e-16
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.93095, p-value = 1.243e-06
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 434170, p-value = 4.447e-07 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.3872511
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 5877, p-value = 0.226 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.88212, p-value = 4.96e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97329, p-value = 0.003839
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 496930, p-value = 0.0001212 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.29868
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 502800, p-value = 0.0001891 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2903871
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1559700, p-value = 0.00234 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5646, p-value = 0.1103 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.80784, p-value = 2.543e-13
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.91549, p-value = 1.393e-07
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 459960, p-value = 5.429e-06 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.350859
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 5583, p-value = 0.08868 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.84998, p-value = 1.374e-11
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.93413, p-value = 1.197e-06
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 551650, p-value = 0.004705 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2214446
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 598550, p-value = 0.0486 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1552569
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1570700, p-value = 0.007043 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5586, p-value = 0.08963 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.81969, p-value = 7.303e-13
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.93, p-value = 8.004e-07
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 504560, p-value = 0.0002155 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2879061
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 6174, p-value = 0.4752 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.80864, p-value = 2.727e-13
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.98739, p-value = 0.1751
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 535090, p-value = 0.001737 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2448244
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 673810, p-value = 0.535 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.04904447
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1789200, p-value = 4.057e-05 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 8234, p-value = 0.006349 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.89978, p-value = 4.697e-09
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.96975, p-value = 0.001596
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 374720, p-value = 3.681e-10 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4711592
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 7712, p-value = 0.06342 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.90187, p-value = 6.231e-09
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.97324, p-value = 0.004111
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 583200, p-value = 0.02442 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.176929
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 683880, p-value = 0.6596 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.03482975
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 767830, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 313, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.85114, p-value = 1.548e-11
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.9908, p-value = 0.4281
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 332780, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.5303411
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 1757, p-value = 5.469e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.86272, p-value = 5.323e-11
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95037, p-value = 2.766e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 642180, p-value = 0.2354 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.09368424
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 508830, p-value = 0.0002944 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2818854
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 741920, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 390, p-value < 2.2e-16 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.90359, p-value = 7.875e-09
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.99531, p-value = 0.9052
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 371460, p-value = 1.574e-10 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4757554
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 2369, p-value = 1.472e-12 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.060213, p-value < 2.2e-16
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95002, p-value = 2.586e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 681090, p-value = 0.6242 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.03877298
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 636330, p-value = 0.1966 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1019348
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1789000, p-value = 4.173e-05 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 8205, p-value = 0.007347 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.9369, p-value = 1.377e-06
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98973, p-value = 0.3061
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 370600, p-value = 1.987e-10 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4769653
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 7618, p-value = 0.08931 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.87682, p-value = 2.636e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95879, p-value = 0.0001377
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 643820, p-value = 0.2472 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.09137251
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 856770, p-value = 0.007653 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.2091634
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1505600, p-value = 1.569e-06 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 4424, p-value = 0.000272 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.53819, p-value < 2.2e-16
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.80977, p-value = 3.791e-12
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 521430, p-value = 0.0007115 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2641029
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 3934, p-value = 8.196e-06 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.83627, p-value = 3.479e-12
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95051, p-value = 2.677e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 557000, p-value = 0.006362 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2139025
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 321890, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.5457102
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1668800, p-value = 0.7337 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5692, p-value = 0.1285 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.62322, p-value < 2.2e-16
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.82598, p-value = 8.734e-12
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 563300, p-value = 0.008973 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.2050056
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 4565, p-value = 0.0006621 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.8292, p-value = 1.765e-12
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95625, p-value = 9.002e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 570010, p-value = 0.01275 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1955414
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 324350, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.5422384
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 84.5679 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1215400, p-value = 2.254e-07 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 6456, p-value = 0.0002034 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.98611, p-value = 0.182
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.9903, p-value = 0.4895
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 151430, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.646635
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 5599, p-value = 0.061 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.75415, p-value = 7.242e-14
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.93766, p-value = 1.335e-05
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 417170, p-value = 0.7583 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.02652989
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 439890, p-value = 0.7584 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.02648552
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1583300, p-value = 0.0173 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 5762, p-value = 0.1606 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.96496, p-value = 0.0004047
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.98607, p-value = 0.1151
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 414580, p-value = 5.432e-08 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4148958
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 7075, p-value = 0.4289 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.74651, p-value = 2.023e-15
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.92018, p-value = 1.87e-07
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 767100, p-value = 0.2956 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.08261109
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 1018900, p-value = 8.055e-09 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.4380018
Ci-dessous est affiché le barplot des lignées restantes après le second filtre. Il reste 100 % des lignées de DATA_Analysis.
Les boxplots suivants sont les valeurs du phénotype étudié pour les individus de chaque lignée, ces dernières étant ordonnées selon leur médiane. Le premier graphique est pour l’âge 1, le second pour l’âge 4.
Les valeurs phénotypiques de tous les individus sont maintenant organisées en fonction des âges, sans un regard à la lignée, afin de voir si on a une tendance générale.
Un premier test de Wilcoxon est appliquée à ces données. Si la p-valeur est inférieure à 0.05, cela signifie que les deux populations (age1, age4) ont des moyennes significativement différentes et ne suivent donc pas une même distribution. Wilcoxon rank sum test with continuity correction
data: value by age W = 1796800, p-value = 1.392e-05 alternative hypothesis: true location shift is not equal to 0
Ici, on ne travaille plus avec les individus mais avec les lignées. Les médianes des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux médianes des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci un test paired. Wilcoxon signed rank test with continuity correction
data: median by age V = 8472, p-value = 0.001765 alternative hypothesis: true location shift is not equal to 0
Les graphiques suivants sont issus des indicateurs de moyenne \(I_m = (med4-med1)/med1\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de moyenne est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian$diff W = 0.9029, p-value = 7.172e-09
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de moyenne (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmedian_no_outliers$diff W = 0.99001, p-value = 0.3382
Ci-dessous, on voit la correlation entre l’âge 1 et l’âge 4 pour la médiane.
Coefficient de correlation de Spearman pour la médiane. Spearman’s rank correlation rho
data: dfmedian\(median1 and dfmedian\)median4 S = 358920, p-value = 2.388e-11 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.4934522
De même que pour la médiane, on ne travaille plus avec les individus mais avec les lignées. Les mad des lignées pour les deux âges ont été calculées et mises sous forme d’un boxplot comparable avec le précédent, il nous permet de voir la tendance générale ainsi que les lignées ayant un comportement extrême, qui ont été labellisées.
Le test de Wilcoxon a maintenant été appliqué aux mads des lignées pour l’âge 1 et l’âge. On a pu faire dans ce cas-ci aussi un test paired. Wilcoxon signed rank test with continuity correction
data: mad by age V = 8094, p-value = 0.01259 alternative hypothesis: true location shift is not equal to 0
Les graphiqueS suivant sont issus de l’indicateur de variation \(I_v = (CV_r4-CV_r1)/CV_r1)\), et représentent les mêmes données sous des formes différentes. Les lignées du graphique de droite ont été ordonnées suivant cette différence.
La normalité de la distribution de l’indicateur de variation est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad$diff W = 0.87793, p-value = 3.005e-10
Les graphiques suivants sont semblables aux précédents, les données ‘extrêmes’ ont toutefois été enlevées afin de voir si cela améliorait la normalité de la distribution des données.
La normalité de la distribution de l’indicateur de variation (sans extrêmes) est évaluée grâce à un shapiro test. Si la p-value obtenue est inférieure à 0.05, on considère que l’échantillon a une distribution non gaussienne.
Shapiro-Wilk normality test
data: dfmad_no_outliers$diff W = 0.95751, p-value = 0.000117
Ci-dessous, on voit la correlation entre CVr4 (mad4/med4) et CVr1 (mad1/med1).
Coefficient de correlation de Spearman pour les CVrs. Spearman’s rank correlation rho
data: dfmad\(mad1 and dfmad\)mad4 S = 598120, p-value = 0.04772 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.1558638
La corrélation Im Iv affichée ci-dessous est la corrélation entre les indicateur Im et Iv pour chacune des lignées.
Coefficient de correlation de Spearman pour la correlation Iv Im. Spearman’s rank correlation rho
data: mgmedmad\(diff.median and mgmedmad\)diff.mad S = 892230, p-value = 0.0008977 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -0.2592169
| phenotypes | valid_strain |
|---|---|
| DI_on_Hp_Mean | 100.00 |
| DiastolicIntervals_Mean | 100.00 |
| DiastolicIntervals_Median | 100.00 |
| DiastolicIntervals_StdDev | 100.00 |
| DiastolicIntervals_StdDevOnMedian | 100.00 |
| DiastolicMeanDiameter | 84.57 |
| FractionalShortening | 84.57 |
| Heartperiod_Mean | 100.00 |
| Heartperiod_Median | 100.00 |
| Heartperiod_StdDev | 100.00 |
| Heartperiod_StdDevOnMedian | 100.00 |
| Heartrate_Mean | 100.00 |
| Heartrate_Median | 100.00 |
| Heartrate_StdDev | 100.00 |
| Heartrate_StdDevOnMedian | 100.00 |
| NormalizedIntervals_Mean | 100.00 |
| NormalizedIntervals_Median | 100.00 |
| NormalizedIntervals_StdDev | 100.00 |
| NormalizedIntervals_StdDevOnMedian | 100.00 |
| Pcent_Long_DI | 4.32 |
| Pcent_Long_SI | 0.00 |
| SD_on_Median_Heartperiod | 100.00 |
| SI_on_DI_Mean | 100.00 |
| SystolicIntervals_Mean | 100.00 |
| SystolicIntervals_Median | 100.00 |
| SystolicIntervals_SI_on_Hp_Mean | 100.00 |
| SystolicIntervals_StdDev | 100.00 |
| SystolicIntervals_StdDevOnMedian | 100.00 |
| SystolicMeanDiameter | 84.57 |
| Total_DI | 66.67 |
| Total_DI_Time | 100.00 |
| Total_SI | 66.67 |
| Total_SI_Time | 100.00 |
La table suivante est un récapitulatif des distributions qui sont normales ou non, détaillées plus haut pour chaque phénotypes
| mediane_avec_extremes | mediane_sans_extremes | mad_avec_extremes | mad_sans_extremes | |
|---|---|---|---|---|
| DI_on_Hp_Mean | Normale | |||
| DiastolicIntervals_Mean | Normale | |||
| DiastolicIntervals_Median | ||||
| DiastolicIntervals_StdDev | Normale | |||
| DiastolicIntervals_StdDevOnMedian | ||||
| DiastolicMeanDiameter | Normale | Normale | ||
| FractionalShortening | Normale | |||
| Heartperiod_Mean | Normale | |||
| Heartperiod_Median | Normale | |||
| Heartperiod_StdDev | ||||
| Heartperiod_StdDevOnMedian | Normale | |||
| Heartrate_Mean | ||||
| Heartrate_Median | Normale | |||
| Heartrate_StdDev | ||||
| Heartrate_StdDevOnMedian | ||||
| NormalizedIntervals_Mean | ||||
| NormalizedIntervals_Median | ||||
| NormalizedIntervals_StdDev | ||||
| NormalizedIntervals_StdDevOnMedian | ||||
| SD_on_Median_Heartperiod | Normale | |||
| SI_on_DI_Mean | ||||
| SystolicIntervals_Mean | Normale | |||
| SystolicIntervals_Median | Normale | |||
| SystolicIntervals_SI_on_Hp_Mean | Normale | |||
| SystolicIntervals_StdDev | ||||
| SystolicIntervals_StdDevOnMedian | ||||
| SystolicMeanDiameter | Normale | Normale | ||
| Total_DI_Time | Normale | |||
| Total_SI_Time | Normale |
Les deux heatmap suivante représentent lindicateur de moyenne pour les phenotypes étudiés. Le souci est que 3 des phénotypes présentent que 84% des lignées du fichier utilisé, il y aura donc des données manquantes. Les deux graphiques correspondent à deux stratégies pour palier à ceci.
Première proposition : On enlève les lignes avec des données manquantes, on traite donc les 29 phénotypes avec 138 observations.
Deuxième proposition : Les phénotypes avec des données manquantes sont enlevés, on traite donc 26 phenotypes mais avec les 163 observations.
On fait de même avec l’indicateur de variation.
Première proposition : On enlève les lignes avec des données manquantes, on traite donc les 29 phénotypes avec 138 observations.
Deuxième proposition : Les phénotypes avec des données manquantes sont enlevés, on traite donc 26 phenotypes mais avec les 163 observations.